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(57) Abstract 

The invention concerns the deregulation of chromatin-regulator genes which have an SET domain, such deregulation being of 
importance in certain cancer conditions. These genes, in particular the SET domains as such, can be used in the diagnosis and therapy of 
such conditions. 

(57) Z usamm en fassung 

Die Deregulation von Chromatinregulatorgenen, die eine SET-Domane aufweisen, spielt eine Rolle bei bestimrnten Krebserkrankun- 
gen. Diese Gene konnen somit, insbesondere die SET-Domane als solche, als Grundlage fUr die Diagnose und Therapie dieser Erkrankungen 
dienen. 
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Chromatin- Regulatorgene 

Die vorliegende Erfindung bezieht sich auf Gene, die 
eine Rolle bei der strukturellen und f unktionellen 
Regulation von Chromatin spielen, und ihre Verwendung 
fur die Therapie und Diagnostik. 

Die funktionelle Organisation von eukaryotischen 
Chromosomen in Centromere, Telomere sowie in eu- und 
heterochromatische Regionen stellt einen entscheidenden 
Mechanismus zur Gewahrleistung der genauen Replikation 
und Verteilung der genet ischen Information bei jeder 
Zellteilung dar. Im Gegensatz dazu sind Tumorzellen 
haufig durch chromosomale Rearrangements, 
Translokationen und Aneuploidie charakterisiert 
(Solomon et al . , 1991; Pardue, 1991). Obwohl die 
Mechanismen, die zu einer erhohten 

Chromosomeninstabilitat in Tumorzellen fuhren, noch 
nicht geklart sind, haben es in jungster Zeit eine 
Reihe von experimentellen Systemen, beginnend mit 
telomerischen Positionsef f ekten in Hefe (Renauld et 
al., 1993; Buck und Shore, 1995; Allshire et al., 

1994) , fiber Posit ionseffekt -Variegation (PEV) in 
Drosophlla. (Reuter und Spierer, 1992) , bis zur Analyse 
von Translokationsbruchpunkten in humanen Leukamien 
(Solomon et al., 1991; Cleary, 1991), ermoglicht, 
einige chromosomale Proteine zu identif izieren, die an 
der deregulierten Proliferation ursachlich beteiligt 
sind. 

Erstens wurde f estgestellt , dafi die Uberexpression 
einer verkilrzten Version des SIR4 -Proteins zu einer 
verlangerten Lebensdauer in Hefe fuhrt (Kennedy et al., 

1995) . Da SIR-Proteine zum Entstehen multimerer 
Komplexe an den stillen "Mating Type Loci" und am 
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Telomer beitragen, konnte es sein, da£ uberexprimiertes 
SIR4 mit diesen heterochromatinartigen Komplexen 
interf eriert , was schlie£lich zu einer unkontrollierten 
Proliferation f uhrt . Diese Annahme steht im Einklang 
mit der Haufigkeit des Auftretens einer deregulierten 
Telomerenlange in den meisten humanen Krebsarten 
(Counter et al . , 1992). 

Zweitens wurden mittels genetischer Analysen von PEV in 
Drosophila eine Reihe von Genprodukten identif iziert , 
die die Chroma t ins truktur an heterochromatischen 
Positionen und innerhalb des homeotischen Genclusters 
verandern (Reuter und Spierer, 1992) . Mutationen 
einiger dieser Gene, wie modulo {Garzino et al., 1992) 
und polyhomeotic (Smouse und Perrimon, 1990) , konnen in 
Drosophila die deregulierte Zellprolif eration oder den 
Zelltod verursachen. Drittens wurden Saugetierhomologe 
von sowohl Aktivatoren {trithorax oder trx-Gruppe) als 
auch Repressor en , (z.B. polycomb oder Pc-Gruppe) der 
Chroma tinstruktur von homeotischen Drosophila- 
Selektorgenen beschrieben. Unter diesen hat sich vom 
humanen HRX/ALL-1 ( trx-Gruppe) gezeigt, daS es an der 
durch Translokation induzierten Leukamogenese beteiligt 
ist (Tkachuk et al., 1992; Gu et al., 1992), und da£ 
die Uberexpression des Maus-Jbzni (Pc-Gruppe) zum 
Entstehen von Lymphomen fuhrt (Haupt et al., 1991; 
Brunk et al., 1991; Alkema et al., 1995). Ein Modell 
f*Qr die Funktion chromosomaler Proteine la£t darauf 
schliefeen, dafi diese multimere Komplexe bilden, welche 
in Abhangigkeit von der Ausgewogenheit zwischen 
Aktivatoren und Repressoren im Komplex den 
Kondensationsgrad der umliegenden Chromatinregion 
bestimmen (Locke et al., 1988). Eine Verschiebung 
dieses Gleichgewichts durch Uberexpression einer der 
Komponenten des Komplexes zeigte eine Neuverteilung von 
eu- und heterochromatischen Regionen (Buck und Shore, 
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1995; Reuter und Spierer, 1992; Eissenberg et al., 
1992) . Dieser Dosiseffekt kann die Chromatinstruktur an 
vorbestimmten Loci destabilisieren, was letztlich zu 
einem Ubergang vom normalen zum transf ormierten Zustand 
f uhrt . 

Trotz der Charakterisierung von HRX/ALL-1 und bmi als 
Protoonkogene, die die Chromatinstruktur verindern 
k&nnen, ist das Wissen uber Saugetiergenprodukte, 
welche mit Chromatin wechselwirken, noch sehr 
beschrankt. Im Gegensatz dazu wurden durch genetische 
Analysen von PEV in Drosophlla ca. 120 Allele fur 
Chromatinregulatoren beschrieben (Reuter und Spierer, 
1992) . Kurzlich wurde eine carboxyterminale Region mit 
Ahnlichkeit in der Sequenz identif iziert , die einem 
positiven (jtrx, trx-Gruppe) und einem negativen (E(z) , 
Pc-Gruppe) Drosophila-Chromatinregulator (Jones und 
Gelbart, 1993) gemeinsam ist. Daruberhinaus ist dieser 
Carboxyterminus auch in jgu(var)3-9, einem dominanten 
Supressor der Chromatinverteilung in Drosophlla, 
konserviert (Tschiersch et al . , 1994). 

Bei der vorliegenden Erfindung wurde von der Uberlegung 
ausgegangen, da£ diese als "SET" bezeichnete 
Proteindomane (Tschiersch et al., 1994) wegen ihrer 
evolutionaren Konservierung und dem Vorhandensein in 
antagonistischen Genprodukten eine neue Genfamilie 
entwicklungsgeschichtlich wichtiger Saugetier- 
Chromatinregulatoren def iniert . Daruberhinaus tr&gt die 
Charakterisierung weiterer Mitglieder der Gruppe von 
SET-Domane-Genen, neben HRX/ALL-1, zur Aufklarung der 
Mechanismen bei, die dafur verantwortlich sind, daiS 
strukturelle Veranderungen im Chromatin zur malignen 
Transformation fuhren konnen. 
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Der vorliegenden Erfindung lag somit die Aufgabe 
zugrunde, humane Chromatinregulatorgene zu 
identif izieren, ihre Funktion aufzuklaren und sie fur 
die Diagnostik und Therapie einzusetzen. 

Zur Losung dieser Aufgabe wurde zunachst die 
Sequenzinf ormation der SET-Domane benutzt, um aus 
humanen cDNA-Banken die zu den SET-Domane-Genen von 
Drosophila homologen humanen cDNAs zu erhalten. Es 
wurden zwei cDNAs erhalten, die Humanhomologe von E(z) 
bzw. Su(var) 3-9 darstellen; die entsprechenden humanen 
Gene wurden als EZH2 und SUV39H bezeichnet (vgl . • 
unten) ; aufierdem wurde eine variant e Form von EZH2 
identif iziert , die als EZH1 bezeichnet wurde. 

Die vorliegende Erfindung betrifft somit DNA-Molekule , 
enthaltend eine fur ein Chromatinregulator- Protein, das 
eine SET-Domane aufweist, kodierende Sequenz oder eine 
Teilsequenz davon, dadurch gekennzeichnet , daS sie die 
in Fig. 6 oder in Fig. 7 dargestellte Nukleotidsequenz 
aufweisen. Die erf indungsgemafien DNA-Molekule werden im 
folgenden auch als "erf indungsgemSEe Gene" bezeichnet. 

Die erf indungsgemaSen Gene tragen die Bezeichnung EZH2 
und SUV39H, sie wurden ursprunglich als "HEZ-2" und 
"H3-9 11 bezeichnet. 

Die Erfindung betrifft in einem weiteren Aspekt die von 
diesen Genen abgeleiteten cDNAs, einschlieSlich ihrer 
degenerierten Varianten; Mutanten, die fttr funktionelle 
Chromatinregulatoren kodieren sowie Varianten, die auf 
eine Genduplikation zurQckzufuhren sind; ein Beispiel 
dafiir ist EZH1, dessen Teilsequenz im Vergleich mit 
EZH2 in Fig. 8 dargestellt ist. 
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Zur Losung der im Rahmen der vorliegenden Erfindung 
gestellten Aufgabe wurde im einzelnen wie folgt 
vorgegangen: Ausgehend von der Sequenz information von 
der konservierten SET-Domane, wurde unter reduzierter 
Stringenz eine humane B-Zell-spezif ische cDNA- 
Bibliothek mit einer gemischten Drosophila-DNA- Sonde, 
die fur die SET-Domanen von E(z) und £u(var)3-9 
kodiert, gescreent. Aus 50 0*000 Plaques wurden 4 0 
primare Phagen ausgewahlt. Nach zwei weiteren Runden 
Screening zeigte sich, daS 31 Phagen fur authentische 
E(z) -Sequenzen kodieren und daS funf Phagen E(z)~ 
Varianten darstellen. Im Gegensatz dazu hybridisierten 
nur zwei Phagen mit der Sonde, die die SET-Domane von 
Su(var)3-9 allein enthielt . Die Phageninserts wurden 
mittels Polymerasekettenreaktion (PCR) amplifiziert und 
mittels Restriktionskartierung und Teilsequenzierung 
analysiert. Representative cDNA- Inserts wurden 
subkloniert und uber ihre ganze Lange seguenziert . Die 
S'-Enden wurden isoliert, indem positive Phagen. noch 
einmal mit 5 ' -DNA-Sonden gescreent wurden, worauf nach 
Subklonierung komplette cDNAs erhalten wurden. 

Die komplette, fiir das humane Homologe von E(z) 
kodierende cDNA wurde als EZH2 und die DNA, die fur das 
humane Homologe von Su(var) 3-9 kodiert, wurde als 
SUV39H bezeichnet. Insgesamt betragt die Identitat der 
AminosSuren zwischen Drosophlla und den humanen 
Proteinen 61 % fur EZH2 und 43 % fur SUV39H, wobei die 
C-terminale SET-Domane sehr hoch konserviert ist 
(88 % fiir EZH2 und 53 % fur SUV39H) . Der 
Sequenzvergleich zeigte weitere deutliche 
Homologieregionen, z.B. eine Cystein-reiche Domane in 
EZH2 und eine Chromo-Box in SUV39H. (In polycomb wurde 
gezeigt, da£ die Chromo-Box die fur die Wechselwirkung 
zwischen DNA und Chromatin wesentliche Domane ist; 
Messmer et al., 1992). Im Gegensatz dazu fehlen die 
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207 Aminosauren, die das aminoterminale GTP- 
Bindungsmotiv des Drosophi la- Proteins enthalten, im 
humanen Homologen SUV39H. 

Der Vergleich der Aminosaure - Sequenzen zwischen den 
Drosophila- und den humanen Genen ist in den Fig. 1 
und 2 dargestellt : 

Fig. 1 zeigt den Vergleich der Aminosaure -Sequenz 
zwischen EZH2 und von Drosophila Enhancer von zeste 
(E(z)), Identische Aminosauren der konservierten 
carboxyterminalen SET-Domane (schattierte Box) und der 
Cys-reichen Region (Cys-Reste sind hervorgehoben) sind 
gezeigt* Die mutma£lichen Kernlokalisierungssignale 
sind unterstrichen. 

Fig. 2 zeigt den Vergleich der Aminosaure -Sequenz 
zwischen dem humanen Homologen SUV39H und Drosophila 
Su(var) 3-9 . Identische Aminosauren der konservierten 
carboxyterminalen SET-Domane (schattierte Box) und der 
Chromo-Domane (dunkler schattierte Box) sind 
dargestellt. Die mutmafilichen Kernlokalisierungssignale 
sind unterstrichen. Oben in der Figur ist eine 
schematische Ubersicht der beiden Proteinstrukturen 
dargestellt, die zeigt, daS im humanen Homologen 
207 Aminosauren am N-Terminus fehlen. 

Da translationale Consensussequenzen in Umgebung des 
Start -ATG der humanen SUV39H- cDNA auch an der 
entsprechenden internen Position in 5u(var)3-9 
vorhanden sind, durfte das Drosophila- Protein 
zusatzliche Exons enthalten, die in einem spateren 
Stadium der Evolution fiir die Funktion entbehrlich 
wurden. (Die Richtigkeit dieser Hypqthese kann 
bestatigt werden, indem die humane SOV3SH-CDNA und 
komplette oder am 5 ■ -Ende verfcurzte cDNAs von 
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Su(var) 3-9 in Drosophila exprimiert werden. 
Daruberhinaus wurde eine weitere cDNA der Bezeichnung 
MG-44 beschrieben 

(s. unten) ; der ebenfalls das 5"-Ende des Drosophila- 
Gens fehlt.) Zusatzlich zur humanen cDNA von SUV39H 
wurde auch der hotnologe Locus in der Maus (Suv3 9h; 
siehe unten) isoliert, dessen Sequenzanalyse und 
Promotorstruktur eindeutig die aminoterminale 
Verkurzung saugerhomologer Gene im Vergleich zu 
Drosophila Su (var) 3-9 bestatigt. 

Im Rahmen der vorliegenden Erfindung durchgefuhrte DNA- 
Blot-Analysen deuten darauf hin, da£ saugerhomologe 
Gene von Su (var) 3-9 in der Maus und im Menschen von 
einzelnen Loci reprasentiert werden, wahrend 
saugerhomologe Gene von E(z) in der Maus und im 
Menschen durch zwei getrennte Loci kodiert sind. Der 
zweite humane Locus (als EZH1 bezeichnet) wurde auch 
durch Charakterisierung einer kleinen Anzahl von cDNA- 
Varianten, die sich in ihren 3 1 -f lankierenden Sequenzen 
von der Mehrzahl der aus der humanen cDNA-Bibliothek 
isolierten Klone unterscheiden, bestatigt. Die 
Unterschiede zwischen EZH2 und EZH1 im sequenzierten 
Bereich sind in Fig. 8 dargestellt: Die SET-Domane von 
EZH1 zeigt gegenuber EZH2 Mutationen; auSerdem tragt 
die von uns isolierte EZH1- Variant e (sehr 
wahrscheinlich eine aberrant gespleifcte cDNA) ein sich 
im Leserahmen befindliches Stopcodon, welches das . 
Protein um die 4 7 C-terminalen Aminosauren verkurzt . In 
Fig. 8 ist die Nukleotidsequenz der EZH2-CDW& von 
Position 1844 bis 233 0 in der jeweils oberen Zeile 
dargestellt, wobei die 5' Spleifestelle und das 
potent ielle Stopcodon unterstrichen sind. Um eine 
Teilsequenz der cDNA der EZH1 -Variante der £ZH2-Seguenz 
zuzuordnen, wurde das gap-Programm des Wisconsin GCG 
Netzwerkservice verwendet. Das vorzeitige Stopcodon in 
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EZH1 (Position 353) ist unterstrichen . Sequenzen, die 
fur die konservierte SET-Domane kodieren, sind 
hervorgehoben. Aufierdem ist das 3 1 -Ende (Position 151 
in EZH1) des aberranten Transkripts B52 (s. unten) 
dargestellt. Uber die verfiigbare Sequenz zeigte sich 
B52 zu 97 % identisch mit EZH1 und zu 72 % identisch 
mit EZH2. Der Sequenzvergleich von EZH1 mit EZH2 sowie 
die Feststellung, da& beim Menschen und der Maus zwei 
getrennte E(z) -homologe Loci auftreten, lassen darauf 
schlie£en, da£ bei Saugern eine Genduplikation 
auf getreten ist . 

In einera Vergleich mit cDNA- Sequenzen in der Datenbank 
GeneBank wurde uberraschend f estgestellt , da£ bestimmte 
in der Datenbank eingetragene cDNA-Teilsequenzen, die 
von aberranten Transkripten in Tumorgeweben abgeleitet 
sind, mutierte Versionen der erf indungsgema&en cDNAs 
darstellen: 

Einerseits war auf der Suche nach BRCA1 , einem Gen, das 
fur Brust- und Eileiterkrebs pradisponiert , eine 
partielle cDNA-Sequenz mit 271 Nukleotiden der 
Bezeichnung B52, die fftr eine mutierte Variante der 
SET-Domane kodiert, isoliert und auf dem humanen 
Chromosom 17q21 kartiert worden (Friedman et al., 
1994) . Es wurde im Rahmen der vorliegenden Erfindung 
Uberraschend f estgestellt , dafi B52 97 % Identitat mit 
der erf indungsgemafien EZH1 - cDNA- Var i ant e aufweist (vgl . 
oben) ; moglicherweise stellt EZH1 ein Gen dar, dessen 
Reaktivierung bei der deregulierten Proliferation eine 
Rolle spielt. 

Andererseits war eine cDNA (2*800 Nukleotide; MG-44) 
vom humanen Chromosom Xpll isoliert worden (Geraghty 
et al., 1993), einer Region, die fiir degenerative 
Storungen der Netzhaut und Synovialsarkome 
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pradisponiert . Es wurde uberraschend f estgestellt , da£ 
diese cDNA 98 % Identit§t mit der erf indungsgemafcen 
SUVJStf-cDNA aufweist. 

Die im Rahmen der vorliegenden Erfindung 

bereitgestellten neuen Gene ermoglichen es somit, einen 
Zusammenhang zwischen bestimmten Krebserkrankungen und 
Mutationen in Chromatinregulatoren herzuleiten; im 
Falle der MG-44-cDNA konnte, da diese mehrere Punkt- 
und Frameshift -Mutationen aufweist, welche die Chromo- 
und SET-Domanen unterbrechen, erst anhand der 
erf indungsgemafien 

SUV3 9H- cDNA ein Zusammenhang zwischen Su (var) 3-9 und 
MG-44 aufgeklart werden. 

Neben den bereits genannten Sequenzen sind in der 
Sequenzdatenbank GeneBank als weitere humane Mitglieder 
der SET-Proteinf amilie das gut dokumentierte humane 
Homologe von Drosophila trx, HRX/ALL-1 (Tkachuk et al . , 
1992; Gu et al . , 1992) eingetragen, ferner ein Gen 
unbekannter Funktion der Bezeichnung G9a, das im 
humanen Major Histocompatibility Complex (Milner und 
Campbell, 1993) vorhanden ist, drittens eine nicht 
publizierte cDNA (KG-1) , die aus unreif en myeloiden 
Tumorzellen isoliert wurde (Nomura et al . , 1994). 
Wahrend G9a derzeit das einzige humane Gen mit einer 
SET-Domane ist, fur das bisher keine mutierte Version 
bekannt ist, tragt KG-1 eine Insertion von 342 
Aminosauren, welche die SET-Dom§ne in eine Amino- und 
eine Carboxyterminale HSlfte spaltet . Wahrscheinlich 
stellt diese KG-2-cDNA eine aberrant gespleiSte 
Variante dar, da sich 5* und 3 1 Konsensus-SpleiSstellen 
and beiden Enden der Insertion finden. Insgesamt sind 
vier der funf derzeit bekannten humanen Mitglieder der 
SET-Proteinf amilie Anderungen unterworfen, die alle die 
. SET-Domane mutieren (HRX/ALL-1, EZH1/B52, SUV39H/MG-44 
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und KG-1) . Dariiberhinaus wurden in drei Fallen die 
entsprechenden humanen Genloci in der Nahe von 
Translokationsbruchpunkten oder instabilen 
chromosomal en Regionen kartiert {HRX/ALL-1, EZH1/B52 
und SUV39H/MG-44) . In Fig. 3 sind die aberranten 
Transkripte von humanen SET- Domane -Genen dargestellt . 
Links in der Figur ist die Lage der funf derzeit 
bekannten SET - Domane - Gene auf dem jeweiligen Chromosom 
angegeben. U.a. sind die drei Gene (HRX/ALL-1, EZH1/B52 
und SUV39H/MG-44) , fur die aberrante cDNAs auf 
Translokationsbruchpunkten oder instabilen 
Chromatinregionen kartiert wurden, dargestellt. Vier 
der funf dargestellten SET-Domanen Gene weisen 
Mutationen auf, die alle die Carboxyterminale SET- 
Domane unterbrechen, welche in der Figur durch die 
dunkle Box dargestellt ist. Eine Translokation 
verbindet die aminoterminale Halfte von HRX mit einer 
nicht korrelierten Gensequenz, die als gepunktete Box 
mit der Bezeichnung ENL dargestellt ist. Mutationen und 
ein vorzeitiges Stopcodon verandern die SET-Domane von 
EZH1/B52 . Punkt- und Frameshift -Mutationen unterbrechen 
die Chromo- und SET-Domane in MG-44. Eine groSe 
Insertion spaltet die SET-Domane von KG-1 in zwei 
Half ten. Aberrante Transkripte sind derzeit fur GSa 
nicht bekannt. Das Cystein-reiche Cluster in B52 ist 
als gepunktete Box dargestellt; in HRX/ALL-1 sind die 
Homologieregion zu Methyltransf erasen als schraffierte 
Box und die A/T-Haken als vertikale Linien dargestellt. 
Die Namen der jeweiligen authentischen Gene sind rechts 
in der Figur angegeben. 

Die Tatsache, daS ein Saugetiergen der SET- 
Proteinf amilie, HRX/ALL-1 , mit t ransl oka t ions - 
induzierter Leukamogenese im Zusammenhang gebracht 
wurde (Tkachuk et al., 1992; Gu et al., 1992), ist ein 
starker Hinweis dafur, da£ Proteine mit der SET-Domane 
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nicht nur wichtige Regulatoren der Entwicklung sind, 
die chroma tinabhangige Veranderungen der Genexpression 
mitbestimmen, sondern da£ sie, nach Mutation, auch die 
normale Zellprolif eration storen. 

Da alle bisher . beschriebenen Mutationen die 
Primarstruktur der SET-Domane unterbrechen, liegt die 
Vermutung nahe, daS es die SET-Domane als solche ist, 
die eine entscheidende Rolle im Ubergang vom normalen 
zum transf ormierten Zustand spielt. Eine wichtige 
Funktion fur die SET-Domane kann ferner aufgrund ihrer 
evolutionaren Konservierung in Genprodukten, die von 
der Hefe bis zum Menschen auftreten, vermutet werden. 

Fig* 4 zeigt die evolutionare Konservierung von SET- 
Domane-Proteinen: Unter Verwendung des tfasta-Programms 
des Wisconsin GCG Netzwerkservice wurden Proteine und 
offene Leserahmen mit Homologie zur SET-Domane 
identif iziert . In der Figur ist eine representative 
Auswahl von Hefe bis zum Menschen gezeigt. Ziffern 
geben Aminosauren an. Die Carboxyterminale SET-Domane 
ist durch eine schwarze Box dargestellt, Cys-reiche 
Regionen durch eine dunkel gepunktete Box, das GTP- 
Bindungsmotiv in 5u(var)3-9 durch eine hellgepunktete 
Box und die Chromo-Domane von Su(var) 3-9 und H3-9 durch 
eine offene Box mit hellen Punkten. Eine Region mit 
Homologie zu Methyltransf erase ( trx und HRX) ist als 
schraffierte Box dargestellt. A/T- n Haken" ( "A/T Hooks") 
sind durch vertikale Linien dargestellt. Eine weitere 
Ser-reiche Region (S in C26E6.10) und eine Glu-reiche 
Region (E in G9a) oder Ankyrin- Repeats (ANK in G9a) 
sind ebenfalls hervorgehoben. YHR119 (GeneBank 
Accession No. U00059) und C26E6.10 (GeneBank Accession 
No. U13875) sind offene Leserahmen von kurzlich in die 
Datenbank eingetragenen Cosmiden ohne eine funktionelle 
Charakterisierung. Prozente geben die Gesamtheit der 
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Aminosaure-Identitaten zwischen den humanen und den 
Drosophila- Proteinen an. 

Fig. 5 zeigt die Ubereinstitnmung an Aminosauren der 
SET-Domane. Die SET-Domane der in Fig. 4 dargestellten 
Gene wurde unter Verwendung des Pileup-Programms des 
Wisconsin GCG Netzwerkservice angeordnet . Fur den 
Vergleich der XG-2-SET-Domane wurde vor dem Pileup die 
grofie Aminosaure- Insertion, die die SET-Domane in zwei 
Half ten spaltet, entfernt. Aminosaure- Posit ionen, die 
8 von 10 Ubereinstimmungen aufweisen, sind 
hervorgehoben . 

Aufgrund der im Rahmen der vorliegenden Erfindung 
f estgestellten Kriterien erweist sich eine Beteiligung 
der Gene, die eine SET-Domane haben, an der 
chromatinabhangigen Entstehung der deregulierten 
Proliferation; diese Gene bzw. die davon abgeleiteten 
cDNAs sowie Teil- und mutierte Sequenzen konnen somit 
bei der Therapie und Diagnose von Erkrankungen , die auf 
eine derartige Proliferation zuruckzufuhren sind, 
eingesetzt werden: 

Unter schiede im Transkriptionsniveau von SET-Domane- 
RNAs zwischen normalen und transf ormierten Zellen 
konnen als diagnostischer Parameter f\ir Erkrankungen 
herangezogen werden, in denen die Expression von SET- 
Domane -Genen dereguliert ist: 

So konnen Oligonukleotide, kodierend fur die SET-Dom&ne 
als solche bzw. Teilabschnitte davon, als 
diagnostischer Marker verwendet werden, urn bestimmte 
Krebsarten, in denen die SET-Domane mutiert ist, zu 
diagnostizieren. Fflr die detaillierte Analyse der 
Funktion der erf indungsgemaEen cDNAs oder Abschnitten 
davon im Hinblick auf den diagnostischen Einsatz von 
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SET-Domane-Gensequenzen wurden im Rahmen der 
vorliegenden Erfindung die homologen Maus-cDNAs von 
EZH1 (Ezhl) und SUV39H (Suv39h) isoliert. Bei 
Verwendung einer Maus-spezif ischen, fur die SET-Domane 
kodierenden, DNA-Sonde in "RNAse protection" Analysen 
zur Untersuchung der .Ezhl-Genaktivitat wahrend der 
normalen Mausentwicklung zeigte sich ein eher breites 
Expressionsprof il, das ahnlich dem von Jbmi (Haupt et 
al . , 1991) ist. Die mit den Maussequenzen 
durchgefuhrten Analysen werden mit Humansequenzen 
ausgeweitet, um die RNA-Mengen zwischen unreifen 
Vorlauf erzellen, Tumorzellen und dif f erenzierten Zellen 
in verschiedenen humanen Zellkultursystemen zu 
vergleichen. Um f estzustellen / ob sich die SET-Domane 
dementsprechend als diagnostischer Tumormarker fur 
spezifische Krebserkrankungen oder als genereller 
diagnostischer Parameter eignet, konnen gangige 
Methoden zur Bestimmung der RNA-Konzent ration die in 
einschlagigen Labor handbuchern (Sambrook, J., Fritsch, 
E . F ♦ und Maniatis, T., 1989, Cold Spring Harbor 
Laboratory Press) beschrieben sind, wie Northern Blot, 
Sl-Nuclease-Protection-Analyse oder RNAse- Protect ion- 
Analyse, verwendet werden. 

Um die Haufigkeit zu untersuchen, mit der die SET- 
Domane spezifischen Mutationen unterliegt, konnen die 
SET-spezif ischeh DNA-Sonden zur Analyse von 
Einzelstrang-Konf ormationspolymorphismen (single strand 
conformation polymorphisms; SSCP; Gibbons et al., 1995) 
eingesetzt werden. 



Krebsarten, bei denen SET-spezif ische DNA-Sonden als 
diagnostischer Marker verwendet werden kdnnen, sind 
Brustkrebs {EZH1; Friedman et al., 1994), . 
Synovialksarkom (SUV39H; Geraghty et al.; 1993) und 
Leukamien. 
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Aufgrund der Kenntnis der Nukleotidseguenz der SET- 
Domane-Gene konnen die entsprechenden von der cDNA- 
Sequenz abgeleiteten Proteine, die ebenfalls Gegenstand 
der vorliegenden Erfindung sind, in . rekombinanter Form 
herstellt werden, indem die dafur kodierenden cDNAs in 
geeignete Vektoren inseriert und in Wirtsorganismen 
exprimiert werden. Die fur die Produktion rekombinanter 
Proteine verwendeten Techniken sind dem 

Durchschnittsfachmann gelauf ig und konnen einschlagigen 
Handbuchern (Sambrook, J., Fritsch, E.F. und 
Maniatis, T., 1989, Cold Spring Harbor Laboratory 
Press) entnommen werden. 

Gegenstand der vorliegenden Erfindung sind somit in 
einem weiteren Aspekt rekombinante DNA-Molektile, 
enthaltend die filr EZH2, SUV39H oder EZH1 kodierende 
DNA sowie damit funktionell verbundene 
Expressionskontrollsequenzen, sowie die damit 
transf ormierten Wirtsorganismen. 

Die erf indungsgemaSen rekombinanten Proteine konnen 
eingesetzt werden, urn die Wechselwirkung von SET- 
Domane-Proteinen mit Chromatin bzw. mit anderen 
Mitgliedern von Heterochromatinkomplexen zu 
analysieren; ausgehend von den dabei erhaltenen 
Erkenntnissen uber die Wirkungsweise dieser Komplexe 
werden die sich im einzelnen ergebenden Moglichkeiten 
fur das gezielte Eingreifen in die daran beteiligten 
Mechanismen definiert und konnen fur therapeutische 
Anwendungen genutzt werden. 

Untersuehungen, die der weiteren Analyse der Funktion 
der SET-Domane dienen, werden z.B. durchgefuhrt , indem 
cDNAs, kodierend fur humanes EZH2 bzw. SUV39H und 
versehen mit einem Epitop, gegen das AntikSrper zur 
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Verfugung stehen, in vitro sowie in Gewebekulturen 
exprimiert werden. Nach Immunprazipitation mit den 
jeweiligen epitopspezif ischen Antikorpern kann 
festgestellt werden, ob EZH2 und SUV39H miteinander 
in vitro wechselwirken konnen und ob in vivo eine 
Komplexbildung zwischen EZH2 und/oder SUV39H mit 
weiteren Chromatinregulatoren stattfindet. 

Es wurde bereits von anderen Autoren angenommen 
(DeCamillis et al . , 1992; Rastelli et al., 1993; 
Orlando und Paro, 1993) , daS eine Komplexbildung 
zwischen verschiedenen Mitgliedern von 

Heterochromatinproteinen wesentlich fur deren Funktion 
ist . Aufgrund der Verf ligbarkeit der erf indungsgemafien 
SET - Domane - Gene kann festgestellt werden, ob die SET- 
Region eine Domane darstellt, die aufgrund von 
Wechselwirkungen f unktioniert , oder ob sie zum 
Entstehen multitnerer heterochromatischer Komplexe 
beitragt. Ebenso kann festgestellt werden, ob die SET- 
Domane eine inhibitorische Funktion hat, ahnlich der 
aminoterminalen BTB -Domane verschiedener 
Chromatinregulatoren, einschlie£lich des GAGA-Faktors 
(Adams et al . , 1992). Insgesamt erlauben die Analyisen 
von Wechselwirkungen mit Epitop-versehenen EZH2- und 
SUV39H- Pro teinen eine weitere Charakterisierung der 
Funktion der SET-Domane. Dadurch werden Moglichkeiten 
eroffnet, gegen die deregulierte Aktivitat vorzugehen, 
indem z.B. mittels gentherapeutischer Methoden 
dominant -negative Varianten der SET - Domane - cDNA- 
Sequenzen in die Zelle eingeffihrt werden. Derartige 
Varianten werden z.B. erhalten, indem zunachst die 
funktionellen DomSnen der SET-Proteine definiert 
werden, z.B. die fur die DNA/ Chromatin- oder die fiir 
die Protein/Protein-Wechselwirkung ve rant wort lichen 
Sequenzabschnitte, und indem dann die um die 
jeweilige(n) Domane (n) oder um Abschnitte davon 
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verkiirzten DNA-Sequenzen in der betroffenen Zelle zur 
Expression gebracht werden, um eine durch das intakte 
funktionelle Protein verursachte Deregulation der 
Proliferation zu kompetitieren. 

Die Verftigbarkeit der erf indungsgemafcen cDNAs erlaubt 
ferner die Herstellung transgener Tiere, z.B. Mause, in 
denen SET-Domane-Gene entweder uberexprimiert werden 
konnen ( "gain-of -function" ) oder in denen diese Gene 
ausgeschaltet werden konnen ( "loss-of -function" ) ; fur 
letztere Analysen werden die korrespondierenden 
Tiersequenzen, insbesondere Maussequenzen, der 
erfindungsgemaSen Gene eingesetzt. Diese Mause sind 
ebenfalls Gegenstand der vorliegenden Erfindung. 

Insbesondere gibt die "gain-of -function" - Analyse, bei 
der Allele der erf indungsgemafien Gene in die Maus 
eingefuhrt werden, letztlich Auf schlufc aber die 
ursachliche Beteiligung von EZH2 und SUV39H an der 
chromatinabhangigen Forderung der Tumor entstehung. Fur 
die "gain-of -function"- Analyse konnen die kompletten 
cDNA-Sequenzen von humanem EZH2 und SUV39H sowie deiren 
tnutierte Versionen, wie EZH1/B52 und MG-44, mittels 
Vektoren, die hohe Expressionsraten ermoglichen, z.B. 
Plasmiden mit dem humanen £-Actin-Promotor, getrieben 
sowohl vom Enhancer der schweren Kette von 
Immunglobulinen (Eji) als auch von Moloney- Virus - 
Enhancern (Mo-LTR) . Kurzlich wurde gezeigt, da£ die 
E^/Mo-LTR-abhangige Uberexpression des Jbmi-Gens, 
welches gemeinsam mit EZH2 zur Pc-Gruppe negativer 
Chroma tinregulatoren zahlt, ausreicht in transgenen 
Mausen Lymphome zu erzeugen (Alkema et al., 1995). 

Indem in "loss-of -function" -Analysen die endogenen 
Maus -Loci ftir Ezhl und Suv39h durch homologe 
Rekombination in etnbryonalen Stammzellen unterbrochen 
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werden, kann bestimmt werden, ob der Verlust der 

in vivo-Genfunktion zu einer abnormalen Entwicklung der 

Maus f uhrt . 

Aufgrund dieser in vivo- Systeme kann die Wirkung von 
EZH2 und SUV39H bestatigt werden; diese Systeme dienen 
au&erdem als Grundlage fur Tiermodelle im Hinblick auf 
eine humane Gentherapie . 

Der gentherapeutische Einsatz der erf indungsgemafien 
DNA-Sequenzen oder davon abgeleiteter Sequenzen (z.B. 
komplementarer Antisenseoligonukleotide) erfolgt - je 
nachdem, ob die zu behandelnde Erkrankung auf eine 
Deregulation von Chromatin infolge des Fehlens der 
f unktionellen Gensequenz, oder aber infolge einer 
Uberexpression der entsprechenden Gene zuruckzuf uhren 
ist - durch Einfuhrung der f unktionellen Gensequenz, 
durch Inhibierung der Genexpression, z.B. mit Hilfe von 
Antisenseoligonukleotiden, oder durch Einfuhrung einer 
fxir eine dominant -negative Mutante kodierenden Sequenz . 
Die Einfuhrung der jeweiligen DNA-Sequenzen in die 
Zelle kann mit Hilfe von Standardmethoden fur die 
Transfektion hoherer eukaryotischer Zellen erfolgen, zu 
denen der Gentransfer mittels viraler Vektoren 
(Retrovirus, Adenovirus, Adeno-assoziiiertes Virus) 
oder mittels nicht-viralen Systemen auf Basis der 
Rezeptor-vermittelten Endozytose zahlen; Ubersichten 
uber gebrauchliche Methoden werden z.B. von Mitani und 
Caskey, 1993; Jolly, 1994; Vile und Russel, 1994; 
Tepper und Mule, 1994; Zatloukal et al., 1993, 
WO 93/07283 gegeben. 

Fur eine Inhibierung der Expression der 

erf indungsgemafien Gene kommen auch niedermolekulare 

Substanzen in Betracht, die in die. 

Transkriptionsmaschinerie eingreifen; nach Analyse der 
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5 1 -regulatorischen Region der Gene kann nach Substanzen 
gescreent werden, die die Wechselwirkung der jeweiligen 
Transkriptionsf aktoren mit dieser Region ganz oder 
teilweise blockieren, z.B. mit Hilfe der in der 
WO 92/13092 beschriebenen Methode. 

Eine Inhibierung der deregulierten Proliferation kann 
auch am Genprodukt ansetzen, indem die entsprechenden 
Antikorper gegen das EZH2- oder SUV39H- Protein, 
vorzugsweise humane oder humanisierte Antikorper, 
therapeutisch eingesetzt werden. Die Herstellung 
solcher Antikorper erfolgt nach bekannten Methoden, wie 
sie z.B. von Malavsi und Albertini, 1992 , oder von 
Rhein, 1993, beschrieben wurden. 



Antikorper gegen EZH2 oder SUV39H, die therapeutisch 
oder diagnostisch verwendet werden konnen, sind 
ebenfalls Gegenstand der vorliegenden Erfindung. 
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Aminosaure-Sequenzvergleich zwischen EZH2 
und E(z) 

Aminosaure-Sequenzvergleich zwischen SUV39H 
und Su { var) 3-9 

Aberrante Transkripte von humanen SET-Domane- 
Genen 

Evolutionare Konservierung von SET-Domane- 
Proteinen 

Aminosaure-Ubereinstimmung in der SET-Domane 
DNA- und Aminosaure-Sequenz von EZH2 
DNA~ und Aminosaure-Sequenz von SUV39H 
partieller Sequenzvergleich zwischen den 
cDNAs von humanem EZH2 und EZH1 
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Beispiel 

a) Herstellung einer cDNA-Bibliothek 

Es wurde eine humane B-Zell-spezif ische cDNA- 
Bibliothek, wie von Bardwell und Treisman, 1994, 
beschrieben, hergestellt, indem Poly(A) + -RNA aus 
hurnanen BJA-B-Zellen isoliert, mittels Poly(dT) 15 - 
Priming revers transkribiert und in doppelstrangige 
cDNA konvertiert wurde. Nach Zugabe eines EcoRI- 
Adapters der Seguenz 5 1 AATTCTCGAGCTCGTCGACA wurde die 
cDNA in die EcoRI-Stelle des Bakteriophagen gtlO 
ligiert . Die Propagierung und Amplif izierung der 
Bibliothek erfolgte in E.coli C600. 

b) Herstellung von DNA-Sonden 

Drosophi la- DNA-Sonden, kodierend fiir die konservierten 
SET-Dominen von E{z) und Su ( va.r) 3 - 9 , wurden auf der 
Grundlage der publizierten Drosophila-Sequenzen (Jones 
und Gelbart, 1993; Tschiersch et al . , 1994) mittels 
Polymerasekettenreaktion (PGR) hergestellt: 1 fig von 
Drosophlla. melanogaster-DNA (Clontech) wurde mit den 
beiden Primern E(z) 1910 

(5 1 ACTGAATTCGGCTGGGGCATCTTTCTTAAGG) und E{z) 22 BO 
(5 1 ACTCTAGACAATTTCCATTTCACGCT^CTATG) einer PCR- 
Amplif ikation (35 Zyklen zu 30 sek bei 94°C, 30 sek bei 
55 °C und 3 0 sek bei 72 °C) unterworfen. Die 
entsprechende SET - Domane - Sonde fur £u(var)3-9 wurde von 
10 ng Plasmid-DNA (Tschiersch et al., 1994/ Klon M4) 
mit dem Primerpaar suvar.up 

(5 * ATATAGTACTTCAAGTCCATTCAAAAGAGG ) und suvar.dn 
(5 1 CCAGGTACCGTTGGTGCTGTTTAAGACCG) amplif iziert , wobei 
dieselben Zyklusbedingungen verwendet wurden. Die 
erhaltenen SET-Domane-DNA-Fragmente wurden Gel- 
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gereinigt und teilsequenziert , urn die Richtigkeit der 
amplif izierten Sequenzen zu bestatigen. 

c) Screenen der cDNA-Bibliothek 

5 x 10 5 Plaque-bildende Einheiten ("plaque forming 
units", pfu) wurden mit 5 ml Kultur des bakteriellen 
Wirtsstammes E.coli C600 (bei einer optischen Dichte 
OD 60 0 von °- 5 in 10 ™M MgS0 4 suspendiert) bei 3 7°C 
15 min lang inkubiert und dann auf eine grofie (200 mm 
x 200 mm) vorgewarmte LB-Schale ausgegossen. Nach 
Wachstum uber Nacht bei 37°C wurden die Phagen auf 
einer Nylonmembran (GeneScreen) absorbiert . Die Membran 
wurde, die Seite mit den absorbierten Phagen nach oben 
schauend, 30 sek lang in Denaturierungslosung (1.5 M 
NaCl, 0.5 M NaOH) schwimmen gelassen, dann 60 sek in 
Denaturierungslosung eingetaucht und abschliefcend 5 min 
lang in 3 M NaCl, 0.5 M Tris pH 8, neutralisiert . Dann 
wurde die Membran kurz in 3xSSC gespult und die Phagen- 
DNA mittels UV-Vemetzung auf das Nylonfilter fixiert. 
Das Filter wurde 30 min lang bei 5Q°C in 30 ml Church- 
Puffer (1 % BSA, 1 mM EDTA und 0.5 M NaHPQ 4 , pH 7.2) 
prahybridisiert , anschlieSend wurden 2 x 10 6 cpm der 
radioaktiv markierten DNA-Sondenmischung (E{z) -SET \ind 
Su ( var) 3-9-SET) zugegeben; die DNA-Sonden wurden durch 
Random -priming unter Verwendung des RediPrime-Kit 
(Amersham) hergestellt. Die Hybridisierung wurde uber 
Nacht bei 50°C durchgef dhrt . Nach Entfernung der 
Hybridisierungslosung wurde das Filter 10 sek in 2xSSC, 
1 % SDS bei Raumtemperatur gewaschen, anschlieSend 
wurde 10 sek lang bei 50°C gewaschen. Das Filter wurde 
in Saranwrap gewickelt und unter Verwendung einer 
Verstarkerfolie der Autoradiographie unterworfen. 

Positive Phagenkolonien wurden auf der Originalplatte 
mittels Zuordnung des Autoradiogramms identif iziert und 
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die entsprechenden Agarstuckchen mit dem grofieren Ende 
einer Pasteur-Pipette entfernt. Der Phagen-Pool wurde 
liber Nacht bei 4°C in 1 ml SM-Puffer (5,8 g NaCl, 2 g 
MgS0 4 -H 2 0 / 50 ml Tris pH 7.5, 5 ml 2 %ige Gelatine auf 
1 1 H2O) , enthaltend einige Tropfen CHCI3 , eluiert. 
Das Phagenlysat wurde fur eine zweite und dritte 
Screeningrunde wieder ausplattiert urn einzelne, gut 
isolierte positive Plaques (20 bis 100 Plaques pro 
Platte in der dritten Runde) zu erhalten. 

d) Sequenzanalyse 

Die cDNA- Inserts von rekombinanten Phagen wurden in den 
Polylinker von pBluescript KS (Stratagene) subkloniert 
und auf einetn automat ischen Sequenzer (Applied 
Biosystems) unter Verwendung der Didesoxy-Methode 
sequenziert. Die komplette Sequenz von wenigstens zwei 
unabhangigen Isolaten pro erhaltenen Gen wurde mittels 
"Primer walking" ermittelt. Die Sequenzen wurden mit 
dem GCG-Sof tware-Paket (University of Wisconsin) 
analysiert, die Untersuchung auf Homologie wurde mit 
dem "Blast and fasta" Oder "tfasta" Netzwerkservice 
durchgef tihrt . Die kompletten Sequenzen von EZH2 und 
SUV39H sind in Fig. 6 und 7 dargestellt . 
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Patentanspruche 

1. DNA-Molekule, enthaltend eine fur ein 
Chromatinregulator- Protein, das eine SET-Domane 
aufweist, kodierende Sequenz oder eine 
Teilsequenz davon, dadurch gekennzeichnet , dafi 
sie die in Fig. 6, Fig. 7 oder Fig. 8 
dargestellte Nukleotidsequenz, kodierend fur 
EZH2, SUV39H oder EZH1 , einschliefclich ihrer 
degenerierten Varianten sowie Mutant en davon, 
enthalten. 

2. DNA-Molekul nach Anspruch 1, dadurch 
gekennzeichnet, dafi es eine cDNA ist. 

3. DNA-Molekul nach Anspruch 1 oder 2, dadurch 
gekennzeichnet, da& es humanen Ursprungs ist. 

4. cDNA nach Anspruch 3 der Bezeichnung EZH2 . 

5 . cDNA nach Anspruch 3 der Bezeichnung SUV39H. 

6. DNA-Molekul nach Anspruch 4, dadurch 
gekennzeichnet, da£ es die fur die SET-Domane 
von EZH2 kodierende Region oder einen Abschnitt 
davon enthalt. 

7. DNA-Molekul nach Anspruch 5, dadurch 
gekennzeichnet, da£ es die fur die SET-Domane 
SUV39H kodierende Region oder einen Abschnitt 
davon enthalt. 



8. 



DNA-Molekul nach Anspruch 4, dadurch daS es fur 
eine dominant -negative Mutante von EZH2 kodiert. 
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DNA-Molekul nach Anspruch 4 , dadurch da£ es fur 
eine dominant -negative Mutante von SUV39H 
kodiert . . 

Rekombinantes DNA-Molekul, enthaltend eine in 
Anspruch 2 definierte cDNA, funktionell 
verbunden mit Expressionskontrollsequenzen, zur 
Expression in prokaryotischen oder 
eukaryotischen Wirtsorganismen. 

Prokaryotische oder eukaryotische 

Wirtsorganismen, transf ormiert mit rekombinanter 
DNA nach Anspruch 10. 

Rekombinantes humanes Chromatinregulator- Protein 
EZH2 oder ein Abschnitt davon, erhaltlich durch 
Expression einer in Anspruch 4 definierten cDNA. 

Rekombinantes humanes Chromatinregulator- Protein 
SUV39H oder ein Abschnitt davon, erhaltlich 
durch Expression einer in Anspruch 5 definierten 
cDNA. 

Antikorper gegen EZH2. 

Antikorper gegen SUV39H. 

Antisense (desoxy) ribonukleotide mit 
Komplementaritat zu einer Teilsequenz einer in 
Anspruch 1 definierten DNA. 

DNA-Molekul, kodierend fur die SET-Domane eines 
Chromatinregulator-Gens, bzw. fur einen 
Abschnitt davon,. zur Behandlung und Diagnose von 
Erkrankungen des Menschen, die auf eine 



# 
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Deregulation von Chromat inregulator-Genen, die 
eine SET-Domane aufweisen, zuruckzuf tihren sind. 

DNA-Molekul nach Anspruch 6 oder 7 zur 
Behandlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von 
Chromat inr egul at or -Genen, die eine SET-Domane 
aufweisen, zuruckzuf uhren sind. 

Antikorper nach Anspruch 14 oder 15 zur 
Behandlung und Diagnose von Erkrankungen des 
Menschen, die auf eine Deregulation von 
Chromatinregulator-Genen, die eine SET-Domane 
aufweisen, zuruckzuf uhren sind. 

Transgene Maus, enthaltend ein Transgen fur die 
Expression eines Chromatinregulator-Gens, das 
eine SET-Domane aufweist, oder einer mutierten 
Version eines solchen Proteins. 

Knock-out Maus, erhaltlich aus embryonalen 
Stammzellen, in denen die endogenen Maus-Loci 
fur Ezhl und Suv39h durch homologe Rekombination 
unterbrochen wurden. 

Verfahren zum Identif izieren von Saugetier- 
Chromatinregulator-Genen, die eine SET-Domane 
aufweisen, oder mutierten Versionen davon, . 
dadurch gekermzeichnet , da& man Saugetier-cDNA- 
oder genomische DNA-Bibliotheken unter 
Bedingungen niedriger Stringenz mit einem DNA- 
Molektil, kodierend fur die SET-Domane oder einen 
Abschnitt davon, hybridisiert . 
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EZH2 Lange: 2600bp (kodierend: 90-2330) 



1 AGGCAGTGGAGCCCCGGCGGCGGCGGCGGCGGCGCGCGGGGGCGACGCGCGGGAACAACG 60 

€ 1 CGAGTCGGCGCGCGGGACG AAGAATAATCATGGGCCAGACTGGGAAGAAATCTGAGAAGG 120 

MGQTGKKSEKG 

121 GACCAGTTTGTTGGCGGAAGCGTGTAAAATCAGAGTACATGCGACTGAGACAGCTCAAGA 180 
PVCWRKRVKSEYMRLRQLKR 

181 GGTTCAGACGAGCTGATGAAGTAAAGAGTATGTTTAGTTCCAATCGTCAGAAAATTTTGG 240 
FRR ADEVKSMFSSNRQKILE 
. . • • • • 

241 AAAGAACGGAAATCTTAAACCAAGAATGGAAACAGCGAAGGATACAGCCTGTGCACATCC 300 
RTEILNQEWKQRRIQ PVHZ L 

• ••••• 

30 1 TGACTTCTGTGAGCTCATTGCGCGGGACTAGGGAGTGTTCGGTGACCAGTGACTTGGATT 360 
TSVSS L RGTRECSVT SDLDF 

• • • 

361 TTCCAAC ACAAGTC ATCCCATTAAAG ACTCTGAATGCAGTTGCTTCAGT ACCXAT AATGT 420 
PTQVI PLKTLNAVASVP IMY 

421 ATTCT TGGTCTCCCC TACAGCAGAATTTTATGGTGGAAGATGAAACTGTTTTACATAACA 480 
SWS PLQQNFMVEDETVLHNI 

481 TTCCTTATATGGGAGATGAAGTTTTAGATCAGGATGGTACTTTCATTGAAGAACTAATAA 54 0 
P YMGD EVLDQDG TFI EELIK 

• ••••• 

541 AAAATTATGATGGGAAAGTACACGGGGATAGAGAATGTGGGTTTATAAATGATGAAATTT 600 
NYDGKVHGDRECGFINDEIF 

601 TTGTGGAGTTGGTGAATGCCCTTGGTCAATATAATGATGATGACGATGATGATGATGGAG 660 
VELVN A LGQYNDDDD D D DG D 

661 ACGATCCTGAAGAAAGAG AAGAAAAGC AGAAAGATCTGGAGG ATCACCGAGATGATAAAG 720 
DPEEREEKQKDLEDHRDDKE 
.»•••• 

721 AAAGCCGCCCACCTCGGAAATTTCC TTCTGATAAAATT T TTGAAGCCATTTCCTCAATGT 780 
SRPPRKF PSDK IFEA ISSMF 

781 TTCCAGATAAGGGCACAGCAGAAGAACTAAAGGAAAAATATAAAGAACTCACCGAACAGC 840 
PDKGTAEELKEKYKEfcTEQQ 

• • • • 

841 AGCTCCCAGGCGCACTTCCTCCTGAATGTACCCCCAACATAGATGGACCAAATGCTAAAT 900 
LPGALPPECTPNIDGPNAKS 

901 C TGTT CAGAG AGAGC AAAGCTT ACACTCCTT TC AT ACGCTTTTCTGT AGGCGATGTTTT A 9 60 
VQREQSLHSFHTLFCRRCF K 

• • • • • * 

961 AATATGACTGCTTCCTACATCCTTTTCATGCAACACCCAACACTTATAAGCGGAAGAACA 1020 
YDCFLHP FHATPNTYKRKNT 

1021 CAGAAACAGCTCTAGACAACAAACCTTGTGGACCACAGTGTTACCAGCATTTGGAGGGAG 1080 
ETALDNKPCGPQCYQHLEGA 

1081 CAAAGGAGTTTGCTGCTGCTCTCACCGCTGAGCGGATAAAGACCCCACCAAAACGTCCAG 1140 
K E F A A A I» TA B R I K T P PKRPG 
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1141 GAGGCCGCAGAAGAGGACGGCTTCCCAATAACAGTAGCAGGCCCAGCACCCCCACCATTA 1200 
GRRRGRLP NNSSRPSTPTIN 

1201 ATGTGCTGGAATCAAAGGATACAGACAGTGATAGGGAAGCAGGGACTGAAACGGGGGGAG 12 60 
VLESKDTDSDREAGTETGGE 

• ■ • • • . 

1261 AGAACAATGATAAAGAAGAAGAAGAGAAGAAAG ATGAAACTTCGAGC TCCTCT GAAGCAA 1320 
NNDKEEEEKKDETSSSSEAN 

1321 ATTCTCGGTGTCAAACACCAATAAAGATGAAGCCAAATATTGAACCTCCTGAGAATGTGG 1380 
SRCQTPIKMKPNIEPPENVE 

1381 AGTGGAGTGGTGCTGAAGCCTCAATGTTTAGAGTCCTCATTGGCACTTACTATGACAATT 1440 
WSGAEASMFRVLIGTYYDNF 

• • • » • • 

1441 TCTGTGCCATTGCTAGGTTAATTGGGACCAAAACATGTAGACAGGTGTATGAGTTTAGAG 1500 
CAIARLIGTKTCRQVYEFRV 

1501 TCAAAGAATCTAGCATCATAGCTCCAGCTCCCGCTGAGGATGTGGATACTCCTCCAAGGA 1560 
KESSI IAPAPAEDVDTPPRK 

1561 AAAAGAAGAGGAAACACCGGTTGTGGGCTGCACACTGCAGAAAGATACAGCTGAAAAAGG 1620 
KKRKHRLWAAHCRKIQLKKD 

1621 ACGGCTCCTCTAACCATGTTTACAACTATCAACCCTGTGATCATCCACGGCAGCCTTGTG 1680 
GSSNHVYNYQPCDHPRQPCD 

1681 ACAGTTCGTGCCCTTGTGTGATAGCACAAAATTTTTGTGAAAAGTTTTGTCAATGTAGTT 1740 
SSCPCVIAQNFCEKFCQCSS 
» • • • • • 

1741 CAGAGTGTCAAAACCGCTTTCCGGGATGCCGCTGCAAAGCACAGTGCAACACCAAGCAGT 1800 
ECQNRFP GC RCKAQCNTKQ C 

• ■ • • • • 

1801 GCCCGTGCTACCTGGCTGTCCGAGAGTGTGACCCTGACCTCTGTCTTACTTGTGGAGCCG 1860 
PCYLAVRECDPDLCLTCGAA 

1861 CTGACCATTGGGACAGTAAAAATGTGTCCTGCAAGAACTGCAGTATTCAGCGGGGCTCCA 1920 
DHHDSKNVSCKNCSIQRGSR 

1921 AAAAGCATCTATTGCTGGCACCATCTGACGTGGCAGGCTGGGGGATTTTTATCAAAGATC 1980 
KHLLLAPSDVAGWGXFIKDP 

• • • • • • 

1981 CTGTGCAGAAAAATGAATTCATC7CAGAATACTGTGGAGAGATTATTTCTCAAGATGAAG 2040 
VQKNEFISEYCGE XXSQDEA 

2041 CTGACAGAAGAGGGAAAGTGTATGATAAATACATGTGCAGCTTTCTGTTCAACTTGAACA 2100 
DRRGKVYDKYMCSFLFNLNN 

• • ■ • • • 

2101 ATGATTTTGTGGTGGATGCAACCCGCAAGGGTAACAAAATTCGTTTTGCAAATCATTCGG 2160 
DFVVDATRKGNKIRFANHSV 

• • • ■ • • 

2161 TAAATCCAAACTGCTATGCAAAAGTTATGATGGTTAACGGTGATCACAGGATAGGTATTT 2220 
NPNCYAKVMMVN GDHRIGIF 

2221 TTGCCAAGAGAGCCATCCAGACTGGCGAAGAGCTGTTTTTTGATTACAGATACAGCCAGG 2280 
AKRAI QTGEELFFDYRYSOA 
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2281 CTGATGCCCTGAAGTATGTCGGCATCGAAAGAGAAATGGAAATCCCTTGACATCTGCTAC 2340 

DALKTfVGI EREME I P 

2341 CTCCTCCCCCTCCTCTGAAACAGCTGCCTTAGCTTCAGGAACCTCGAGTACTGTGGGCAA 2400 

2401 TTTAGAAAAAGAACATGCAGTTTGAAATTCTGAATTTGCAAAGTACTGTAAGAATAATTT 2460 

• * " 

2461 ATAGTAATGAGTTTAAAAATCAACTTTTTATTGCCTXCTCACCAGCTGCAAAGTGTTTTG 2520 
2521 TACCAGTGAATTTTTGCAATAATGCAGTATGGTACATTTTTCAACTTTGAATAAAGAATA 2580 
2581 CTTGAACTTGTCAAARAAAA 2600 
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SUV39H Lange: 2732 bp (kodierend: 45-1284) 



1 TCGCGAGGCCGGCTAGGCCCGAATGTCGTTAGCCGTGGGGAAAGATGGCGGAAAATTTA^ 60 

M A E N L K 

61 AAGGCTGCAGCGTGTGTTGCAAGTCTTCTTGGAATCAGCTGCAGGACCTGTGCCGCCTGG 120 
GCSVCCKSSWNQLQDLCRLA 

• • • • • m 

121 CC AAGCTCTCCTGCCCTGCCCTCGGT ATCTCT AAGAGGAACCTCTATGACTTTGAAGTCG 180 
KLSCPALGI SK RNLYDFEVE 



181 AGTACCTGTGCGATTACAAGAAGATCCGCGAACAGGAATATTACCTGGTGAAATGGCGTG 240 
YL CDYKKIREQEYYLVKWRG 

• • • • • • 

241 GATATCCAGACTC AG AG AGCACCTGGGAGCCACGGCAGAATC TCAAGTGTGTGCGTATCC 300 
YPDSESTWEPRQNLKCVRIL 

• • • ■ • • 

301 TCAAGCAGTTCCACAAGGACTTAGAAAGGGAGCTGCTCCGGCGGCACCACCGGTCAAAG A 360 
KQFHKDLERELLRRHHRSKT 

361 CCCCCCGGCACCTGGACCCAAGCTT GGCCAACTACCTGGTGCAGAAGGCCAAGCAGAGGC 420 
PRHLDPS LANYLVQKAKQRR 

421 GGGCGC TCCGTCGC T GGG AGC AGGAGCTCAATGCCAAGCGC AGCC ATCTGG GACGCATC A 480 
ALRRWEQELNAKRS HLGRXT 

481 CTGTAGAGAATGAGGTGGACCTGGACGGCCCTCCGCGGGCCTTCGTGTACATCAATGAGT 540 
VENEVDLDGPP RAFVYINEY 

541 ACCGTGTTGGTGAGGGCATCACCCTCAACCAGGTGGCTGTGGGCTGCGAGTGCCAGGACT 600 
RVGEG ITLNQVAVGCECQDC 

601 GTCTGTGGGCACCCACTGGAGGCTGCTGCCCGGGGGCGTCACTGCACAAGTTTGCCTACA 660 
LWAPTGGCCPGASLHKFAYN 

661 ATGACCAGGGCCAGGTGCGGCTTCGAGCCGGGCTGCCCATCTACGAGTGC AACTCCCGCT 720 
DQGQVRLRAGLP IYECNSRC 

721 GCCGCTGCGGCTATGACTGCCCAAATCGTGTGGTACAGAAGGGTATCCGATATGACCTCT 780 
RCGYD CP NRVVQK GI RY DLC 

781 GCATCTTCCGG ACGG ATG ATGGGCGTGGCTGGGGCGTCCGC ACCCTGGAGAAG ATTCGCA 840 
IFRTD DGRGWGVRTLEKIRK 

841 AGAACAGCTTCGTCATGGAGTACGTGGGAGAGATCATTACCTCAGAGGAGGCAGAGCGGC 900 
NSFVMEYVGEI XTSEEAERR 

• m • • • • 

901 GGGGCCAGATCTACGACCGTCAGGGCGCCACCTACCTCTTTGACCTGGACTACGTGGAGG 960 
GQIYDRQGATYLFDLDYVED 

• » • • • « 

961 ACGTGTACACCGTGGATGCCGCCTACTATGGCAACATCTCCCACTTTGTCAACCACAGTT 1020 
V YT VDAAYYG NISHFVNHSC 

• • • • • • 

1021 GTGACCCCAACCTGCAGGTGTACAACGTCTTCATAGACAACCTTGACGAGCGGCTGCCCC 1080 
DPNLQVYNVFI DNLDERLPR 



1081 GCATCGCTTTCTTTGCCACAAGAACCATCCGGGCAGGCGAGGAGCTCACCTTTGATTACA 1140 
IA FFATRTIRAGEELTFDYN 



9/11 



# 



WO 96/35784 PCT/EP96/01818 

Fig. 7/2 

1141 AC ATGC AAG T GGAC CCC GT GGAC ATGG AG AGCACCCGC ATGG ACT C CAACT TT GGCCTGG 1200 
MQVDPVDMESTRMDSKFGLA 

1201 CTGGGCTCCCTGGCTCCCCTAAGAAGCGGGTCCGTATTGAATGCAAGTGTGGGACTGAGT 1260 
GLPGSPKKRVRIECKCGTES 

1261 CCTGCCGCAAATACCTCTTCTAGCCCTTAGAAGTCTGAGGCCAGACTGACTGAGGGGGCC 1320 
C R K Y L F * 

1321 TGAAGCTACATGCACCTCCCCCACTGCTGCCCTCCTGTCGAGAATGACTGCCAGGGCCTC 1380 

1301 GCCTGCCTCCACCTGCCCCCACCTGCTCCTACCTGCTCT ACGTTCAGGGCTGTGGCCGTG 1440 

1441 GTGAGGACCGACTCCAGGAGTCCCCTTTCCCTGTCCCAGCCCCATCTGTGGGTTGCACTT 1500 

1501 ACAAACCCCCACCCACCTTCAGAAATAGTTTTTCAAC ATCAAGACTCTCTGTCGTTGGGA 1560 

1561 TTCATGGCCTATTAAGGAGGTCCAAGGGGTGAGTCCCAACCCAGCCCCAGAATATATTTG 1 620 

1621 TTTTTGCACCTGCTTCTGCCTGGAGATTGAGGGGTCTGCTGCAGGCCTCCTCCCTGCTGC 1680 

1681 CCCAAAGG TAT GGGG AAGC AACCCCAGAGCAGG CAG ACAT C AG AGGC CAGAG T GCC TAGC 1740 

1741 CCGACATGAAGCTGGT TCCCCAACCACAGAAACTT TGTACTAGTGAAAGAAAGGGGTCCC 1800 

1801 TGGCCTACGGGCTGAGGCTGGTTTCTGCTCGTGCTTACAGTGCTGGGTAGTGTTGGCCCT 1860 

1861 AAGAGCTGTAGGGTCTCTTCTTCAGGGCTGCATATCTGAGAAGTGGATGCCCACATGCCA 1920 

1921 CTGGAAGGGAAGTGGGTGTCCATGGGCCACTGAGCAGTGAGAGGAAGGCAGTGCAGAGCT 1980 

1981 GGCCAGCCCTGGAGGTAGGCTGGGACCAAGCTCTGCCTTCACAGTGCAGTGAAGGTACCT 2040 

2041 AGGGCTCTTGGGAGCTCTGCGGTTGCTAGGGGCCCTGACCTGGGGTGTCATGACCGCTGA 2100 

2101 CACCACTCAGAGCTGGAACCAAGATCTAGATAGTCCGTAGATAGCACTTAGGACAAGAAT 2160 

2161 GTGCATTGATGGG GT GGT GATGAGGTGCCAGGCACT AGG T AGAGCAC CTGG T CCACGTGG 2220 

2221 ATTGTCTCAGGGAAGCCTTGAAAACCACGGAGGTGGATGCCAGGAAAGGGCCCATGTGGC 2280 

2281 AGAAGGCAAAGTACAGGCCAAGAATTGGGGGTGGGGGAGATGGCTTCCCCACTATGGGAT 2340 

2401 ACCCTGGTTCCACTGGTCTCAAAAGTCACCTGCCTACAAATGTACAAAAGGCGAAGGTTC 2460 

2461 TGATGGCTGCCTTGCTCCTTGCTCCCCCACCCCCTGTGAGGACTTCTCTAGGAAGTCCTT 2520 
- 

2521 CCTGACTACCTGTGCCCAGAGTGCCCCTACATGAGACTGTATGCCCTGCTATCAGATGCC 2580 

2581 AGATCTATGTGTCTGTCTGTGTGTCCATCCCGCCGGCCCCCCAGACTAACCTCCAGGCAT 2640 
2641 GGACTGAATCTGGTTCTCCTCTTGTACACCCCTCAACCCTATGCAGCCTGGAGTGGGCAT 2700 
2701 CAATAAAATGAACTGTCGACTGAAAAAAAAAA 2732 
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EZH2 1B44 TCTTACTTGTGGAGCCGCTGACCATTGGGACAGTAAAAATGTGTCCTGCA 1893 
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EZH1 1 ACTCACCTGTGGGGCCTCAGAGCACTGGGACTGCAAGGTGGTTTCCTGTA 50 
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1894 AGAACTGCAGTATTCAGCGGGGCTCCAAAAAGCATCTATTGCTGGCACCA 1943 
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51 AAAACTGCAGCATCCAGCGTGGACTTAAGAAGCACCTGCTGCTGGCCCCC 100 
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214 4 TTT TGCAAATC ATTCGGTAAATC . ATGAT ' 2191 

IIIIIMHIIili n inn 1UI1 Mill 1111 I \ 

301 ATTTGCAAATCATTCAGTGAATCCCAACTGTT^ 350 
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